- R语言的特征(跳过)
- 工作界面与工作流程介绍
- 演示:基础操作与数据分析流程
- 使用github获得最新讲义
- 学习资料介绍
2019年9月13日
Chester Ismay
改变默认语言(建议设定为英文)
etc\Rconsole文件,language = en.Renviron,LANGUAGE=en查询当前工作目录getwd() 改变默认工作目录 setwd("D:/work")
注意Mac与Windows电脑路径表达差异
通过菜单file->reopen with encoding,简体中文通常可尝试选择gb2312解决
自动生成的模板文件已经设定了头部yaml
简单的文本和代码以及相关操作说明。
通过cmd+op+I插入代码。
简单的标记语法(记得带空格)
技巧:可以将一个语法手册放在手边,随时参考 .
| 设定 | 效果 |
|---|---|
| include=FALSE | 代码可以执行,报告(html、word)中不出现代码和结果,但是运行的结果存在workspace中,可以直接调用 |
| echo = FALSE | 执行代码,打印结果,但是不打印代码~即最终报告中出现的结果,没有代码 |
| evalue = FALSE | 不执行代码,仅呈现 |
| message = FALSE | 执行代码,打印代码,不打印结果 |
| warning = FALSE | 执行代码,不打印出warning的信息 |
| fig.cap = "…" | 输出图形结果时添加标题 |
| fig.width / fig.height | 设定输出图大小 |
编辑完成之后可以通过Rstudio上的Knit按钮进行转码打印
呈现全球国家的预期寿命(life expectancy)和人均GDP(GDP per capita)之间的关系. Hans Rosling曾经做个一个TED演讲。
下面将使用 dplyr包 (用于数据处理 data wrangling) 和 ggplot2 (用于作图,visualization) .
首先要确保这些包都安装了(installed).
在markdown中加载(Load)这些包:
library(dplyr) library(ggplot2) library(gapminder) library(gganimate)
可以这样做
library(car)
## Loading required package: carData
## ## Attaching package: 'car'
## The following object is masked from 'package:dplyr': ## ## recode
summary(Duncan)
## type income education prestige ## bc :21 Min. : 7.00 Min. : 7.00 Min. : 3.00 ## prof:18 1st Qu.:21.00 1st Qu.: 26.00 1st Qu.:16.00 ## wc : 6 Median :42.00 Median : 45.00 Median :41.00 ## Mean :41.87 Mean : 52.56 Mean :47.69 ## 3rd Qu.:64.00 3rd Qu.: 84.00 3rd Qu.:81.00 ## Max. :81.00 Max. :100.00 Max. :97.00
# gapminder <- read.csv("https://stat.duke.edu/~mc301/data/gapminder.csv")
# setwd("/Users/liding/E/Bdata/liding17/2017R/lesson3/")
gapminder <- read.csv("../data/gapminder.csv")
以gapminder 数据集(dataset)开始
选择年份(year)变量等于2007的案例
将筛选出来的案例存到一个新的数据集gap07
gap07 <- gapminder %>% filter(year == 2007)
任务: 呈现 gdpPercap 与lifeExp之间的关系.
qplot(x = gdpPercap, y = lifeExp, data = gap07)
任务: 各个大陆的点使用不同的颜色.
qplot(x = gdpPercap, y = lifeExp, color = continent, data = gap07)
任务: 在设定点的大小与人口规模成正比.
qplot(x = gdpPercap, y = lifeExp, color = continent, size = pop,data = gap07)
ggplot(gapminder, aes(gdpPercap, lifeExp, size = pop, colour = continent)) +
geom_point(alpha = 0.7, show.legend = FALSE) +
scale_size(range = c(2, 12)) +
scale_x_log10() +
labs(title = 'Year: {frame_time}', x = 'GDP per capita', y = 'life expectancy') +
transition_time(year) +
ease_aes('linear')
选择windows或者mac版本。
登录之后
更新项目库可以得到最新的讲义,这个文件夹里的东西作为只读即可。 如果想在讲义资料中增加笔记,可将得到的讲义复制到别处在进行修改。 大家也可以创建自己的项目库,将自己更改后的讲义分享到github上。 未来作为项目成员与人合作完成项目时可用github进行版本控制和写作。
管道操作符 %>% 是Stefan Milton Bache and Hadley Wickham在magrittr中首创的.
将上一段命令的结果作为下一行命令的首个默认输入元素,从而可以:
| 功能主题 | 基础命令 | tidyverse |
|---|---|---|
| 字符处理 | 基础函数 | stringr |
| 绘图系统 | plot | ggplot2 |
| 代码风格 | 函数嵌套 | 管道函数(%>%) |
| 列表处理 | list(自建循环) | rlist |
| json处理 | Rjson+RJSONIO | jsonlite |
| 数据抓取 | RCurl+XML | httr+xml2 |
| 循环任务 | for/while——apply | plyr::a_ply——并行运算(foreach、parallel) |
| 切片索引 | subset | dplyr::select+filter |
| 聚合运算 | aggregate | plyr::ddply+mutate——dplyr::group_by+summarize |
| 数据联结 | merge——plyr::join | dplyr::left/right/inner/outer_join |
| 数据塑型 | plyr::melt/dcast | tidyr::gather/spread |
| 功能主题 | 基础命令 | tidyverse |
|---|---|---|
| 聚合运算 | aggregate | plyr::ddply+mutate——dplyr::group_by+summarize |
| 数据联结 | merge——plyr::join | dplyr::left/right/inner/outer_join |
| 数据塑型 | plyr::melt/dcast | tidyr::gather/spread |
data.table 等高效包后面自学很快!
| 命令 | 功能 |
|---|---|
help.start() |
打开帮助文档首页 |
help("foo")或?foo |
查看函数foo的帮助(引号可以省略) |
help.search("foo")或??foo |
以foo为关键词搜索本地帮助文档 |
example("foo") |
函数foo的使用示例(引号可以省略) |
RSiteSearch("foo") |
以foo为关键词搜索在线文档和邮件列表存档 |
apropos("foo", mode="function") |
列出名称中含有foo的所有可用函 |
data() |
列出当前已加载包中所含的所有可用示例数据集 |
vignette() |
列出当前已安装包中所有可用的vignette文档 |
vignette("foo") |
为主题foo显示指定的vignette文档 |